#rl agentivo

Agent^2 RL-Bench: ¿Pueden los agentes LLM diseñar el post-entrenamiento de RL agentivo?

Descubre si los agentes LLM pueden diseñar el post-entrenamiento de RL agéntico. Una exploración sobre inteligencia artificial autónoma.